Protein

Browse of TCMCG042C52370 protein

CDS


Accession Number	TCMCG042C52370
gbkey	CDS
Protein Id	XP_016484506.1
Location	join(30231..31113,31706..31799,31933..32035,32119..32172,32305..32379,32679..32747,32862..32945,33044..33235,34151..34701,34775..34904,35786..35877,35969..36147,36218..36420,36510..36611,37294..37456,38472..38761,38833..38970,39450..39529,39657..39756,40006..40135,40359..40591)
Gene	LOC107805046
GeneID	107805046
Organism	Nicotiana tabacum

Protein


Length	1314aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA319578
db_source	XM_016629020.1
Definition	PREDICTED: DNA mismatch repair protein MSH6-like [Nicotiana tabacum]

EGGNOG-MAPPER Annotation


COG_category	L
Description	Component of the post-replicative DNA mismatch repair system (MMR)
KEGG_TC	-
KEGG_Module	M00295 [VIEW IN KEGG]
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko00001 [VIEW IN KEGG] ko00002 [VIEW IN KEGG] ko03400 [VIEW IN KEGG]
KEGG_ko	ko:K08737 [VIEW IN KEGG]
EC	-
KEGG_Pathway	ko01524 [VIEW IN KEGG] ko03430 [VIEW IN KEGG] ko05200 [VIEW IN KEGG] ko05210 [VIEW IN KEGG] map01524 [VIEW IN KEGG] map03430 [VIEW IN KEGG] map05200 [VIEW IN KEGG] map05210 [VIEW IN KEGG]
GOs	GO:0000217 [VIEW IN EMBL-EBI] GO:0000404 [VIEW IN EMBL-EBI] GO:0003674 [VIEW IN EMBL-EBI] GO:0003676 [VIEW IN EMBL-EBI] GO:0003677 [VIEW IN EMBL-EBI] GO:0003684 [VIEW IN EMBL-EBI] GO:0003690 [VIEW IN EMBL-EBI] GO:0003824 [VIEW IN EMBL-EBI] GO:0005488 [VIEW IN EMBL-EBI] GO:0005575 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0006139 [VIEW IN EMBL-EBI] GO:0006259 [VIEW IN EMBL-EBI] GO:0006281 [VIEW IN EMBL-EBI] GO:0006290 [VIEW IN EMBL-EBI] GO:0006298 [VIEW IN EMBL-EBI] GO:0006725 [VIEW IN EMBL-EBI] GO:0006807 [VIEW IN EMBL-EBI] GO:0006950 [VIEW IN EMBL-EBI] GO:0006974 [VIEW IN EMBL-EBI] GO:0006996 [VIEW IN EMBL-EBI] GO:0008094 [VIEW IN EMBL-EBI] GO:0008150 [VIEW IN EMBL-EBI] GO:0008152 [VIEW IN EMBL-EBI] GO:0009987 [VIEW IN EMBL-EBI] GO:0016043 [VIEW IN EMBL-EBI] GO:0016462 [VIEW IN EMBL-EBI] GO:0016787 [VIEW IN EMBL-EBI] GO:0016817 [VIEW IN EMBL-EBI] GO:0016818 [VIEW IN EMBL-EBI] GO:0016887 [VIEW IN EMBL-EBI] GO:0017111 [VIEW IN EMBL-EBI] GO:0030983 [VIEW IN EMBL-EBI] GO:0032135 [VIEW IN EMBL-EBI] GO:0032300 [VIEW IN EMBL-EBI] GO:0032991 [VIEW IN EMBL-EBI] GO:0033554 [VIEW IN EMBL-EBI] GO:0034641 [VIEW IN EMBL-EBI] GO:0042623 [VIEW IN EMBL-EBI] GO:0043170 [VIEW IN EMBL-EBI] GO:0043570 [VIEW IN EMBL-EBI] GO:0044237 [VIEW IN EMBL-EBI] GO:0044238 [VIEW IN EMBL-EBI] GO:0044260 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI] GO:0046483 [VIEW IN EMBL-EBI] GO:0050896 [VIEW IN EMBL-EBI] GO:0051276 [VIEW IN EMBL-EBI] GO:0051716 [VIEW IN EMBL-EBI] GO:0071704 [VIEW IN EMBL-EBI] GO:0071840 [VIEW IN EMBL-EBI] GO:0090304 [VIEW IN EMBL-EBI] GO:0097159 [VIEW IN EMBL-EBI] GO:1901360 [VIEW IN EMBL-EBI] GO:1901363 [VIEW IN EMBL-EBI] GO:1990391 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGGGTTCTTCTCGCCGCTCCAGCAATGGCAGATCTCCGATCGTCAATCAACAGAGTCAAATCACTTCTTTCTTCTCTAAAATGACTTCGCCCTCACCTTCTCCTTCCCCATCACCTCTTGTCCCTAAAAAAATTCCAGTCAAATCTAACCCTAACCCTAACCCTAATGCTGAGCCTAAACTTAAATATAGTCCTAGTACCAGTCCTTGTGCTAGTCCTACGACACCTTCGCCTCTACAGGTGAAGCGGAAGATAACTGCACCTATTTCTGCCATTATTGACCTTAAGCCGTCGTACGGGCAAGAGATAGTGGGCAAAAGAGTTAAGGTCTACTGGCCATTGGATAGAACTTGGTACGAAGGCTGTGTAAAGTCTTTCGACGGTGTTTCTGGTGAACATTTGGTTAAGTACGACGATGGTGATGAGGAAATGATTGATTTAGCTGAAGAAAAGATCGAATTGGTAGTCGAGGCACCTGCGAGAAAGTTGAGGCGGTTGCGGAAATCTTTGGTGGTGGAAGAAGCTGAGGAGGAGGAGGAGGAAGAGAAATTGGAGGATTTGGAGAGCGTTGAAGATGATTCTGAGGATGAAGATTGGGGAAAAATTGCGGATAAACAAGTGTATGAAGACGAGGATGTTGATGAGGATATGGACTTGGTGGTTGAGGAAGAGAAAGATGATGCTGTTGGATCGAGAAGCAGGAAAGCGGGTGCGGATAAGGTGGTGGTGTCGAGGAAGCGGAAGAGTGGTGAAGGGGTGAAGTTAAGTTCGAGTTCGAGCAAGAAGAGTAAGACTCTTGCAGATAAGAAGAGTGCTAATAGCAAGGTGGACAATGCAGTGAATGGAGTAAATGGGAAAGAGCTTGTTAAAACCAATGAGGATTGTGTCAGGCCAACCAACAATGATAACGTACTGCTGTGCGGTGCAGCAGATAGATTCGGACAACGTGAAGCAGAGAAATTCCCTTTTGTTGCGAAAGATAGGAAGGACGCTAATAGGAGATCCCCTGGAGATGCCAATTATGATCCAAAGACTCTTTACCTACCTCCTAATTTTTTGAAAGGTTTAACTGGTGGTCAGAGACAATGGTGGGAGTTCAAGTCGAAGCACATGGATAAAGTTCTGTTTTTTAAGATGGGAAAGTTCTATGAGCTTTATGAGATGGATGCACATATTGGAACCAAGGAACTTCATTTGCAGTACATGAAGGGAGAACAACCCCATTGTGGATTTCCAGAAAAGAACTTCTCAATGAATGTAGAGAAGTTGGCGCGAAAGGGTTATAGGGTTCTTGTGGTTGAGCAAACAGAGACACCTGAACAGCTTGAGACTCGTCGAAGAGAGAAGGGATCTAAAGATAAGGTCGTCAGACGTGAAATATGTGCAGTGGTCACTAAAGGAACATTAACTGAGGGAGAAATGCTCGCAGCAAACCCTGATGCTTCATATATGATGGCAGTGACTGAAAGCTCTCAAACTGCTGTATTGCAAGGGAAGCGTACTTATGGTGTCTGTATGGTGGATATCACCACAAGCAAGGTTATTATTGGACAGTTTGAGGATGATTCAGATTGTAGTGCCTTGTGTTGTCTGCTTTCTGAGTTAAGACCAGTGGAAATAATAAAGCCAGCTAAATTGCTTAGTCTTGAGACTGAGAGAGTACTGCTGCGGTACACACGTAATCCGCTGGTAAATGAGTTGGTTCCTGTCTCTGAATTTTGGGATGCTGAGAGAACCATTTGTGAGGTGAAGGCAATCTATAGGAATATGAGCAGTCCACCGCTGACATCATCTCCAAATGAAATGGAATCACATGAAAGCACTACCTCAGAGGAATATGGTGAAAGGAACCTTCTACCAGATGTTTTATGTGAGCTTGTAAATCTTGGTAGGAATGGGAGTTATGCACTCTCAGCACTAGGAGGAGCTCTATACTACTTGAAGCAAGCTTTTCTGGACGAATCCCTGCTCAAATTTGCGAAATTTGAACCACTTCCCCTTTCTGGTTTTTGTGATAGTACTCAAAAACCGAATATGGCTCTTGATGCAGCTGCGCTTGAGAATCTTGAGATATTTGAGAACAGTCGAGATGGAGATTCTTCAGGGACATTATACGCTCAAATCAACCATTGTATCACAGCATTTGGGAAAAGGATGCTCAGGTCATGGCTTGCAAGACCCTTATATCATCCAGAGTCCATAAGAGAACGTCAGGATGCTGTAGCCGGATTAAAGGGGCTCAATCTACCTTTTGTTCTTGAGTTTAGAAAAGAGTTGTCAAGGCTTCCTGATATGGAACGGTTGCTTGCACGCCTCTTTGGTAGCAGTGAAGCAAATGGAAGAAATGCAAATAAAGTGATTTTATACGAGGATGCAGCAAAGAAACAACTGCAAGAGTTCGTATCTGCTTTACGTGGATGTGAATCAATGGTGCATGCATGCTCTTCACTTGGGGTGATCTTGGAAAACATGGATTCAAAGCTACTATATTATCTATTAACACCAGGTAAAGGTCTTCCAGATGTAGATTCAATTCTCAAGCATTTCAAGGATGCTTTTGATTGGGTAGAAGCAAATAACTCGGGCCGTATTATACCTCATGAGGGGGTTGATGAGGAGTATGATGCTGCATGTAAACAATTGCAGGAGATTGAACTTAAATTATCCAAGCACTTGAAGGAACAGAGGAAACTGCTTGGAGACTCATCAATAGACTACGTGACTGTAGGAAAAGATGCATACCTTTTGGAAGTACCAGAATGTTTGTGCAGGAGCATTCCGAAGGAGTACGAATTACAGTCATCGAAAAAGGGTTATTTCAGGTACTGGAATCCAGTCTTAAAGAAATTAATCGGAGAGCTCTCACAAGCTGATTCAGAGAAGGAATCTAAGCTAAAAAGTATTTTGCAGAGGTTGATAGGACGGTTTTGTGAACATCATAATAAGTGGAGAGAATTAGTTTGTATCACTGCAGAATTGGATGTTTTAATCAGTTTATCTATTGCGAGCGATTACTATGAGGGACCAACATGTCGTCCAAACATCAAGTCAGTGCCAAGTGAAGATGATGTGCCAGTTCTTCATGCTGAAAATTTAGGACATCCTGTTCTTAAAAGTGATTCTCTAGATAAGGGAGCTTTTGTTTCCAACAATGTTTCCCTTGGCGGTCCTCCGAACGCCAGCTTTATCCTTCTTACTGGTCCTAACATGGGAGGGAAATCCACTCTTTTGCGCCAAGTTTGCATGGCTGTAATTTTGGCCCAGATAGGAGCTGATGTACCAGCATCATCCTTTGACTTATCACCCGTCGATCGTATATTTGTAAGAATGGGGGCCAAAGATCATATTATGGCAGGCCAGAGTACATTCTTGACAGAACTCTTGGAAACTGCTTCAATGCTGTCTTTGGCGAGCCGTAATTCACTTGTCGCACTCGATGAACTTGGTCGCGGTACATCAACTTCCGATGGACAAGCAATAGCTGAATCAGTTCTTGAACACTTTGTCCACAAGGTGCAATGTCGAGGAATGTTTTCTACCCACTATCATCGATTATCTATTGACTATCAGAAAGATTCCAGAGTGTCACTGTGCCATATGGCATGCCAAGTTGGGAAAGGGTCCGGAGGTCTTGAGGAAGTTACTTTTCTATACAGGTTGACACCAGGTGCATGTCCTAAAAGTTATGGTGTCAATGTGGCACGGCTGGCTGGACTTCCTGATGGTGTGCTTCAGAGAGCTGCTGCTAAATCTGAAGAGTTTGAAATTAATGGTTACAATAAGCAATCTGAAGAGAACTCCTATGGGAATTTGACAAGAAAGACAGCAGCACTTGTGCAGAATTTGATGAATTTTATTATTGAAGAGAAATGTGACAATGGTGTGGTTCTTTGTGAGTTGAATGGATTGCAAAGGAGAGCAAGAATACTCCTTGAACAAAATTGA

Protein:
MGSSRRSSNGRSPIVNQQSQITSFFSKMTSPSPSPSPSPLVPKKIPVKSNPNPNPNAEPKLKYSPSTSPCASPTTPSPLQVKRKITAPISAIIDLKPSYGQEIVGKRVKVYWPLDRTWYEGCVKSFDGVSGEHLVKYDDGDEEMIDLAEEKIELVVEAPARKLRRLRKSLVVEEAEEEEEEEKLEDLESVEDDSEDEDWGKIADKQVYEDEDVDEDMDLVVEEEKDDAVGSRSRKAGADKVVVSRKRKSGEGVKLSSSSSKKSKTLADKKSANSKVDNAVNGVNGKELVKTNEDCVRPTNNDNVLLCGAADRFGQREAEKFPFVAKDRKDANRRSPGDANYDPKTLYLPPNFLKGLTGGQRQWWEFKSKHMDKVLFFKMGKFYELYEMDAHIGTKELHLQYMKGEQPHCGFPEKNFSMNVEKLARKGYRVLVVEQTETPEQLETRRREKGSKDKVVRREICAVVTKGTLTEGEMLAANPDASYMMAVTESSQTAVLQGKRTYGVCMVDITTSKVIIGQFEDDSDCSALCCLLSELRPVEIIKPAKLLSLETERVLLRYTRNPLVNELVPVSEFWDAERTICEVKAIYRNMSSPPLTSSPNEMESHESTTSEEYGERNLLPDVLCELVNLGRNGSYALSALGGALYYLKQAFLDESLLKFAKFEPLPLSGFCDSTQKPNMALDAAALENLEIFENSRDGDSSGTLYAQINHCITAFGKRMLRSWLARPLYHPESIRERQDAVAGLKGLNLPFVLEFRKELSRLPDMERLLARLFGSSEANGRNANKVILYEDAAKKQLQEFVSALRGCESMVHACSSLGVILENMDSKLLYYLLTPGKGLPDVDSILKHFKDAFDWVEANNSGRIIPHEGVDEEYDAACKQLQEIELKLSKHLKEQRKLLGDSSIDYVTVGKDAYLLEVPECLCRSIPKEYELQSSKKGYFRYWNPVLKKLIGELSQADSEKESKLKSILQRLIGRFCEHHNKWRELVCITAELDVLISLSIASDYYEGPTCRPNIKSVPSEDDVPVLHAENLGHPVLKSDSLDKGAFVSNNVSLGGPPNASFILLTGPNMGGKSTLLRQVCMAVILAQIGADVPASSFDLSPVDRIFVRMGAKDHIMAGQSTFLTELLETASMLSLASRNSLVALDELGRGTSTSDGQAIAESVLEHFVHKVQCRGMFSTHYHRLSIDYQKDSRVSLCHMACQVGKGSGGLEEVTFLYRLTPGACPKSYGVNVARLAGLPDGVLQRAAAKSEEFEINGYNKQSEENSYGNLTRKTAALVQNLMNFIIEEKCDNGVVLCELNGLQRRARILLEQN

Browse of TCMCG042C52370 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence